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摘 X [目的 /意义 ] 研 究 以 科学 数据 为 信息 载体 ,探究 用 户 在 进行 数据 检索 时 ,影响 其 进行 相关 性 判断 的 标准 的 使 用 特 


征 , 从 而 进一步 探究 科学 数据 用 户 的 信息 
法 /过 程 ] 通 过 调查 问卷 .访谈 与 层次 


行为 ,为 完善 数据 检索 平台 和 加 强 数据 共享 与 服务 提供 理论 支持 。[ 方 
次 分 析 法 相 结 合 的 方法 开展 研究 ,用 户 为 高 校 和 科研 单位 在 读 研究 生 。|[ 结果 
结论 ] 分 析 结 果 显 示 相 关 性 标准 呈现 4 个 特征 :相关 性 标准 的 使 用 情况 符合 著名 的 长 尾 定 


律 ;@ 主 题 性 在 相关 


性 判断 过 程 中 具有 锚 定 功能 ;@) 相 关 性 标准 在 相关 性 判断 中 具有 双向 性 ;四 相关 性 标准 使 用 权重 相对 稳定 。 研 究 
准确 把 握 了 科学 数据 用 户 的 检索 策略 ,明晰 了 其 检索 行为 ,为 改进 科学 数据 共享 系统 提供 了 具有 可 操作 性 的 建 
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解决 的 问题 。 本 文 将 从 情境 相关 性 角度 入 手 , 开 展 科 


和 J 相关 性 标准 的 研究 起 源 于 上 世纪 60 年 代 ,二 战 之 

5 着 计算 机 的 发 展 迎 来 了 信息 爆炸 。 为 了 提高 信息 
检索 效率 ,学 者 开始 关注 相关 性 标准 (C. A. Cuadra 
APA. M. Ree 等 中 ) 。 随 后 经 过 将 近 20 年 的 低谷 
E 后 随 着 互联 网 时 代 的 到 来 , 迎 来 了 相关 性 
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KIEDERE RE. 主要 代表 学 者 是 C. 
Bariy , L. Schamber 等 ,他 们 的 对 比 研究 发 现存 在 跨越 


不 国情 境 而 存在 的 共性 标准 中 。A，R，Tadoy 等 上 
Y. Calvin 等 ”学 者 发 现在 不 同情 境 下 ,相关 性 标准 的 
集合 差异 不 大 ,但 是 相关 性 标准 的 使 用 变化 较 大 。 由 
此 可 见 相 关 性 标准 使 用 特征 直接 影响 着 用 户 的 相关 性 
判断 结果 。 

随 着 数据 时 代 的 到 来 ,科学 数据 已 经 成 为 科技 研 
究 领 域 重 要 的 资源 ,科学 数据 共享 不 仅 提高 了 科研 人 
员 的 工作 效率 ,更 避免 了 国家 资源 的 重复 浪费 。 如 今 
大 批 数 据 共 享 平台 建立 ,但 是 其 检索 结果 却 不 尽 人 意 。 
如 何 高 效 地 从 中 检索 与 用 户 需 求 相关 的 数据 成 为 或 待 


学 数据 相关 性 标准 使 用 特征 的 研究 ,力图 从 用 户 的 角 
度 为 数据 共享 平台 的 改进 提供 建议 。 

本 文 基于 科学 数据 使 用 特征 开展 研究 ,研究 的 问 
题 主 要 有 以 下 3 个 :中 科学 数据 用 户 相关 性 判断 中 标 
准 的 使 用 频率 ,重要 性 和 顺序 ;@ 科 学 数据 用 户 在 进行 
相关 性 判断 过 程 中 ,各 个 相关 性 标准 所 起 的 作用 ;@) 在 
不 同 的 数据 相关 性 判断 情境 中 ,相关 性 标准 使 用 的 差 
异性 。 


2 文献 综述 
相关 性 标准 的 研究 发 展 主要 呈现 两 大 特点 : 


(1) 相 关 性 标准 研究 的 信息 载体 都 是 迎合 时 代 的 
发 展 ,以 当代 主流 的 信息 载体 为 研究 对 象 。20 世纪 90 


年 代 ,C. Barry" , L. Schamber 4$ , C. Cool 等 5 , P 

Wang 4? "学 者 针对 文献 相关 性 标准 开展 了 深入 研 
SÉ. NEA 21 世纪 ,相关 性 标准 的 研究 维度 由 文献 扩 到 
互联 网 、 多 媒体 (视频 音乐. 图像) 社交 平台 等 。 从 
2010 年 之 后 ,其 研究 维度 又 进一步 拓宽 到 数据 领域 
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张 贵 兰 , AAR, 876, 等 . 科学 数据 相关 性 标准 使 用 特征 [J]. 图 书 情报 工作 ,2020,64(10):56 - 65. 


(地 理 数据 、 商 务 数据 、 科 学 数据 ) 。 

(2) 相关 性 标准 使 用 的 研究 总 是 在 相关 性 标准 集 
合 研究 之 后 。 无 论 何 种 维度 的 相关 性 研究 ,总 是 先 探 
究 其 集合 ,再 探究 其 使 用 。20 世纪 90 年 代 ,相关 性 标 
准 的 研究 重点 在 相关 性 标准 是 什么 以 及 相关 性 标准 有 
哪些 的 内 容 上 。 在 相关 性 标准 的 研究 基础 上 ,后 人 开 
展 了 不 同 维度 下 .不同 阶段 .不同 用 户 群 体 相关 性 标准 
的 使 用 研究 。 

相关 性 标准 的 研究 随 着 时 代 的 发 展 不 断 丰富 与 完 
善 。 从 最 初 的 文字 时 代 , 到 网 络 时 代 , 再 到 现在 的 数据 
时 代 , 相 关 性 标准 研究 的 信息 载体 从 文献 发 展 到 网 页 、 
图 像 视频、 社交、 音乐 .电子 商务 以 及 科学 数据 等 ; 研 
究 情 境 从 科研 工作 发 展 到 日 常生 活 .休闲 娱乐 .学生 作 
研究 对 象 从 科研 工作 者 发 展 到 中 学 生 教师 网民、 
医 笔记 者 等 。 
数据 相关 性 标准 研究 
LC. Barry fll L. Schamber 人 研究 对 比 发 现存 在 跨 域 情 
境 丽 存在 的 共性 标准 中 ,因此 后 续 相关 性 标准 的 研究 
都 三 在 此 基础 上 进行 不 断 修正 .完善 和 补充 的 。 网 页 
的 得 关 性 标准 增添 了 安全 性 、 便 利 性 ;图 像 的 相关 性 标 
准 道 添 了 分 辨 率 、 清 晰 性 和 方向 性 ;多 媒体 的 相关 性 标 
MERRE T BURE. 
SAER BARAI BIK , EARE KA KHER MEE 
RAER. BIA AORA RA N TRE n FR o 
O2 lonso 等 "研究 了 用 户 在 亚马逊 购买 商品 时 进行 
电 岩 商务 相关 性 判断 时 所 使 用 的 相关 性 标准 ,并 与 非 
电 圣 商务 情境 下 使 用 的 相关 性 标准 频率 进行 了 对 比分 
Vrc 研究 结果 显示 电子 商务 情境 中 ,会 出 现 新 的 相关 
性 标准 (售后 服务 .价格 等 ) ,同时 相关 标准 的 使 用 情 
况 也 会 有 所 不 同 。D.S，Sabbata 等 研究 了 用 户 


Balatsoukas 的 实验 设计 方案 ,采用 三 角 测 量 的 方法 ,全 
方位 采集 用 户 的 检索 过 程 ,包括 事前 访谈 、 情 境 实验 、 
眼 动 仪 记录 .事后 访谈 .调查 问卷 等 方式 。 最 终 识 别 了 
9 个 科学 数据 相关 性 标准 ,分 别 是 主题 性 ` 质量、 功能 
性 \ 便 利 性 、 可 理解 性 、 可 获得 性 、 权 威 性 \ 时 效 性 、 新 颖 
性 。 

张 贵 兰 等 "在 高 飞 研究 的 基础 上 对 科学 数据 相 
关 性 标准 进行 了 细 化 研究 ,系统 梳理 了 相关 性 标准 的 
研究 文献 ,发现 了 相关 性 标准 的 两 大 特点 :中 存在 跨 域 
情境 而 存在 的 共性 标准 集合 ;@ 任 何 信息 载体 下 都 存 
在 与 自身 特点 相关 的 固有 相关 性 标准 。 在 此 基础 上 通 
过 情境 实验 和 内 容 分 析 , 识 别 了 9 个 科学 数据 相关 性 
标准 。 
2.2 相关 性 标准 使 用 研究 

J. Bateman “认为 相关 性 标准 是 影响 相关 性 判 
断 的 关键 因素 ,并 且 会 呈 阶 段 性 变化 ,他 引入 Kuhlthau 
提出 的 信息 检索 的 6 个 认 知 阶段 ,尝试 通过 实证 数据 
(调查 问卷 ) 来 识别 相关 性 标准 并 探究 随 着 认 知 阶段 
的 变化 ,相关 性 标准 的 变化 情况 。P.， Vakkari 等 fr 
究 了 相关 性 标准 随 任务 情境 变化 的 动态 性 。 他 借助 真 
实 的 课堂 环境 ,将 课程 分 为 开始 .中 间 和 结束 三 个 阶 
Bt ,并 在 每 个 阶段 为 11 个 学 生 布置 检索 任务 ,通过 访 
谈 与 出 声 思考 的 方式 获取 数据 。 分 析 结 果 显 示 ,用 户 
无 论 是 判断 参考 资料 还 是 文献 时 使 用 的 相关 性 标准 均 
与 任务 情境 有 密切 关系 。K. L. Maglaughlin ”将 相关 
性 判断 分 为 相关 、 部 分 相关 和 不 相关 ,研究 用 户 在 判断 
三 种 相关 性 时 所 使 用 的 标准 以 及 标准 在 判断 过 程 中 发 
挥 的 积极 或 消极 作用 。 

A. R. Taylor ”将 重点 放 在 了 随 着 任务 阶段 的 深 
入 相关 性 标准 使 用 的 变化 情况 ,并 在 后 续 的 研究 中 对 


在 选择 地 理 数 据 的 时 候 使 用 的 相关 性 标准 ,发 现 与 传 
统 的 数据 相关 性 标准 有 所 不 同 ,出 现 了 地 理 方面 特有 
的 标准 ,比如 可 视 化 ,空间 性 、 方 向 性 等 。T. Reichen- 
bacher 等 "针对 地 理 数据 相关 性 开展 了 进一步 研究 ， 
聚焦 于 移动 手机 地 理 判 断 ,研究 发 现 了 五 大 类 相关 性 
标准 一 一 主题 性 \ 时 空 性 .方向 性 、 聚 类 和 通信 交换 机 ， 
其 中 通信 交换 机 是 移动 手机 特有 的 判断 标准 。X. 
Wang 等 "基于 相关 性 判断 和 移动 营销 的 基础 ,开展 
了 移动 商务 信息 开展 相关 性 研究 。 研 究 采 用 任务 调研 
的 方式 (vignette-based survey) ,识别 了 5 个 相关 性 标 
准 ,分 别 是 主题 性 \ 经 济 价值 ,位置 .时 间 和 可 信和 度 。 
高 飞 “ 首 次 开展 针对 农业 领域 的 科学 数据 的 研 
究 , 借 鉴 传统 学 者 C. Barry 等 和 网 页 相关 性 研究 方面 


实验 进行 了 改进 ,通过 技术 手段 设计 了 集 检索 文献 与 
问卷 调查 为 一 体 的 检索 系统 ,用 户 可 以 根据 每 一 条 检 
索 结 果 及 时 作出 相关 性 判断 ,以 及 判断 所 使 用 的 相关 
性 标准 。 研 究 结果 充分 展示 了 随 着 ISP (Information 
Search Process ) 阶段 的 深入 相关 性 标准 使 用 发 生 的 变 
iko RIU IEK A. R. Taylor 博士 论文 的 实验 设计 ， 
也 开展 了 面向 性 别 差异 与 任务 复杂 性 的 相关 性 标准 研 
究 。 研 究 结果 表明 ,任务 复杂 性 对 相关 性 标准 的 选择 
存在 显著 影响 ,性 别 仅仅 对 文献 总 体 、 作 者 和 文献 类 型 
3 类 判 据 的 选择 存在 影响 ,总 体 而 言 影响 甚 微 。 

R. A. Hamid 等 ”研究 了 不 同 任务 下 图 像 相关 性 
标准 对 相关 性 判断 的 影响 。 研 究 结果 显示 不 同 任务 
下 ,用 户 使 用 的 相关 性 标准 不 同 ,跨越 3 个 任务 都 被 使 
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用 的 标准 有 3 个 ,分 别 是 主题 性 .信息 的 吸引 度 和 构 
Wo R. A. Hamid 等 "对 图 像 相关 性 标准 进行 了 再 次 
深入 研究 ,将 实验 任务 进一步 细 化 ,并 深入 探讨 了 熟悉 
度 .困难 和 满意 度 对 相关 性 判断 的 影响 。 实 验 选取 48 
名 用 户 ,综合 运用 情境 检索 .调查 问卷 和 录 屏 的 方式 记 
录用 户 检索 行为 。 实 验 结果 显示 在 不 同 实验 任务 中 ， 
用 户 所 使 用 的 相关 性 标准 是 相同 的 ,但 是 相关 性 标准 
的 重要 性 却 有 所 不 同 ,如 主题 性 ,准确 性 ,构图 ,情感 
AR. 

Y. S. Chang ^ 将 研究 重点 放 在 了 在 线 新 闻 检 索 
结果 网 页 列表 的 相关 性 标准 使 用 的 动态 性 方面 。 该 动 
态 性 主要 体现 在 两 个 方面 :一 是 检索 结果 网 页 页 数 后 
延 相 关 性 标准 的 使 用 不 同 ;二 是 固定 网 页 检索 结果 排 
列 顺 序 不 同 ,相关 性 标准 的 使 用 不 同 。59% 的 用 户 仅 
使 用 了 单一 标准 进行 了 相关 性 判断 , 且 主 题 性 和 来 源 
是 两 个 最 主要 的 标准 。 
方法 综述 
己 相 关 性 标准 实验 设计 从 最 初 的 单一 式 定性 分 析 发 
展 到 现在 的 多 角度 定量 与 定性 相 结合 。 研 究 方法 从 情 
HESS .访谈 .出 声 思考 .调查 问卷 等 传统 方法 发 展 到 
LARES .访谈 .出 声 思考 调查 问卷 . 眼 动 记录 i 
PEDRI ARRIE 日志、 民族 志 等 方法 相 结合 
使 用 的 三 角 测 量 法 ;分 析 方法 也 从 定性 的 内 容 分 析 和 
频 吹 统计 分 析 发 展 到 定量 的 结构 方程 .回归 分 析 、 相 关 
Heras 

它 研究 方法 的 不 断 完善 也 使 相关 性 标准 的 研究 更 加 


据 过 程 中 ,对 外 界 客观 数据 信息 进行 认 知 加 工 从 而 产 
生 的 外 在 行为 表现 。 根 据 相关 性 标准 的 研究 ,认为 存 
在 跨越 不 同情 境 的 共性 相关 性 标准 ,但 是 相关 性 标准 
的 权重 和 使 用 频次 会 随 着 情境 的 变化 而 发 生变 化 。 用 
户 使 用 相关 性 标准 是 为 了 做 出 相关 性 判断 ,因此 相关 
性 标准 的 使 用 特征 放 到 相关 性 判断 的 过 程 和 情境 中 去 
测量 。 相 关 性 标准 的 重要 性 是 探究 用 户 在 长 时 记忆 中 
较为 固定 的 判断 规则 ,通过 调查 问卷 获取 。 

在 前 期 针对 科学 数据 相关 性 标准 的 研究 中 ,设计 
了 情境 实验 ,对 访谈 内 容 进 行 了 内 容 分 析 , 并 根据 扎根 
理论 提取 了 9 个 相关 性 标准 ,分 别 是 主题 性 .便利 性 、 
全 面 性 .权威 性 质量、 规范 性 、 可 获得 性 、 可 用 性 、 时 效 
性 。 通 过 调查 问卷 将 相关 性 标准 进行 聚 类 分 析 , 将 
9 个 相关 性 标准 分 为 五 大 类 ,其 中 便利 性 、 可 用 性 和 可 
获得 性 归 为 获得 成 本 类 ,质量 、 规 范 性 和 全 面 性 归 为 数 
WAR, 

本 研究 在 前 期 相关 性 标准 研究 的 基础 上 ,设计 实 
验 ,探究 其 相关 性 标准 的 使 用 特征 。 以 传统 相关 性 标 
准 的 情境 研究 设计 为 主线 ,并 引入 了 判断 决策 领域 的 
研究 方法 。 结 合 实际 工作 任务 ,采用 深度 访谈 ,调查 问 
卷 与 层次 分 析 法 定性 与 定量 相互 结合 的 方法 展开 科学 
数据 用 户 相关 性 标准 使 用 特征 研究 。 
3.2 可 操作 化 

本 文 研 究 的 3 个 子 问 题 涉 及 以 下 几 个 变量 :在 相 
关 性 判断 过 程 中 ,用 户 相关 性 标准 的 使 用 频率 、 顺 序 、 
重要 性 、 权 重 以 及 不 同情 境 中 相关 性 标准 的 权重 变化 。 


具 存 说 服 力 。 问 卷 调查 与 结构 方程 相 结合 可 以 定量 准 
确 盒 析 各 个 相关 性 标准 对 相关 性 判断 的 影响 ;检索 日 
志 的 获取 与 分 析 可 以 最 大 化 贴近 用 户 的 现实 检索 情 
境 ; 眼 动 仪 方法 的 引入 可 以 直观 观测 用 户 的 注视 行为 
和 检索 行为 。 即 便 如 此 ,依然 存在 一 些 问题 :大 量 数 
据 的 定量 分 析 ( 如 调查 问卷 和 检索 日 志 ) 无 法 对 标 具 
体 用 户 ,更 脱离 了 检索 情境 ;@ 情 境 实验 与 访谈 耗 时 较 
长 ,定性 分 析 主 观 性 较 强 。 

为 了 弥补 当前 研究 方法 的 不 足 , 研 究 决定 引入 判 
断 决策 领域 中 的 层次 分 析 法 ,将 情境 实验 与 层次 分 析 
法 相 结合 ,结合 情境 将 每 个 用 户 的 差异 性 考虑 进行 , 通 
过 定性 打分 与 定量 线性 计算 ,得 出 相关 性 判断 中 相关 
性 标准 的 权重 ,使 结果 更 具有 说 服 力 。 


3 ”研究 思路 与 实验 设计 


3.1 研究 思 
科学 数据 用 户 相 关 性 标准 使 用 特征 是 用 户 检 索 数 


不 同 的 变量 数据 要 通过 不 同 的 研究 方法 获取 。 

相关 性 标准 的 重要 性 是 用 户 在 长 时 记忆 中 对 各 个 
标准 的 认 知 ,通过 调查 问卷 对 各 个 相关 性 标准 进行 打 
分 获取 , 见 图 1。 

相关 性 标准 的 使 用 频率 ,顺序 .权重 以 及 权重 的 变 
化 都 是 在 特定 的 情境 下 ,因此 根据 用 户 手头 任务 开展 
深度 访谈 获取 相关 性 标准 的 使 用 频率 和 顺序 。 访 谈 结 
束 之 后 让 用 户 依 据 自己 选择 数据 的 标准 用 层次 分 析 法 
进行 打分 ,获取 相关 性 标准 的 权重 以 及 权重 的 变化 。 
其 中 深度 访谈 提纲 问题 有 : 

(1) 个 人 基本 信息 :年 龄 .研究 方向 、 研 究 成 果 、 检 
索 数据 所 用 平台 和 频次 。 

(2) 完 成 当前 任务 中 ,需要 的 数据 有 哪些 ? 

(3) 检索 数据 时 ,首先 判断 的 依据 是 什么 ”其 次 
判断 的 依据 是 什么 ? 

层次 分 析 法 的 结构 模型 见 图 2。 
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*21. 下 面 的 表格 中 ， 我 们 列 出 了 相关 性 标准 的 解释 ， 请 根据 这 些 解释 回忆 在 检索 过 程 中 ， 进 行 相关 性 判断 时 使 用 的 
相关 性 判断 标准 有 哪些 ? 并 根据 不 同 标准 对 您 进行 判断 的 影响 程度 进行 打分 。 ( 依据 重要 程度 ， 从 不 关注 打 0 


分 ， 不 重要 打 1 分 ， 不 太 重要 打 2 分 ， 


一 般 打 3 分 ， 重 要 打 4 分 ， 非 常 重要 打 5 分 ) 


imm 0 2-3] NEEENNÓ 5 查找 数据 与 自己 的 研究 主题 相符 
可 获得 o ] 2 ooo. 外 界 条 件 的 限制 不 影响 自己 通过 各 种 渠道 获 
性 得 数据 
LMeuc-l|- | NE 在 时 间 上 满足 自己 的 研究 需要 
质量 | S 数据 的 质量 
wt | | EE 在 领域 里 面 的 认可 程度 
15 - S; 符合 相应 的 标准 要 求 
L3! 1| - | | EE 数据 可 直接 被 使 用 
Lo 431] |. | E 方便 获取 和 使 用 
zm M e; 数据 对 研究 主题 的 覆盖 程度 高 
图 1 问卷 相关 性 标准 重要 性 打分 截图 
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i 实验 设计 

CC 本 实验 采用 了 情境 访谈 、 调 查 问卷 与 层次 分 析 法 
相 镭 合 的 方法 。 首 先 ,针对 参加 科技 部 举办 科技 资源 
共 罕 服务 大 赛 的 硕士 .博士 研究 生 在 线 发 放 问 卷 ,问卷 
的 刍 要 内 容 包括 用 户 的 基本 信息 .平时 检索 数据 的 频 
率 、 对 科学 数据 的 了 解 以 及 用 户 在 完成 大 赛 过 程 中 选取 
科学 数据 时 相关 性 标准 所 起 的 作用 (根据 重要 性 以 5 级 


层次 分 析 法 结构 模型 


求 硕士 及 以 上 学 历 , 且 在 大 赛 项 目 完成 过 程 中 在 各 大 
数据 中 心 进行 了 数据 检索 。 对 于 完成 问卷 的 被 试 ,每 
人 发 放 10 元 的 劳务 费用 。 

(2) 第 二 阶段 为 情境 访谈 实验 阶段 。 从 参与 共享 
杯 大 赛 的 名 单 中 筛选 出 中 国 农业 科学 院 研 究 生 ,其 研 
究 方向 和 领域 以 数据 检索 为 主 ,最 终 确 定 被 试 20 人 ， 
分 别 来 自 农业 资源 与 农业 区 划 研 究 所 、 农 业经 济 与 发 


量 表 的 形式 打分 ) ;其 次 ,从 参与 比赛 的 群体 中 选取 中 国 
农业 科学 研究 院 6 个 研究 所 的 硕士 .博士 研究 生 20 A, 
开展 访谈 ,深度 调查 用 户 在 大 赛 过 程 中 ,选取 与 自己 需 
求 /研究 相关 数据 时 所 使 用 的 科学 数据 相关 性 标准 ,并 
追问 其 对 相关 性 标准 的 理解 以 及 使 用 的 原因 ,将 访谈 结 
果 记 录 在 事先 准备 好 的 卡片 上 。 最 后 ,访谈 结束 后 , 根 
据 层次 分 析 法 对 相关 性 标准 进行 专家 打分 ,并 根据 打分 
计算 相关 性 标准 在 相关 性 判断 中 的 权重 。 

具体 来 说 ,研究 分 为 两 个 阶段 : 

(1) 第 一 阶段 为 调查 问卷 阶段 ,通过 与 科技 资源 
共享 服务 大 赛 主办 方 联系 ,在 其 QQ 群 和 官方 网 站 发 
布 实验 通知 和 相关 问卷 填写 要 求 并 附带 问卷 链接 ,要 


in| 


展 研 究 所 农业 信息 研究 所 、 生 物 技术 研究 所 、 饲 料 研 
dod 与 可 持续 发 展 研究 所 ,专业 涉及 农业 

经 济 学 、 遥 感 .气象 .生态 、 生 物 基因 、 食 物 营 养 专 业 。1 
-10 号 为 数据 一 般 弄 用 户 ,研究 以 实验 室 数据 为 主 ， 
数据 检索 目的 为 验证 支持 结论 ,检索 数据 频率 一 般 。 
11 -20 号 为 数据 密集 型 用 户 , 研 究 以 公开 数据 为 主 ， 
数据 检索 目的 是 获取 研究 对 象 ,检索 频率 密集 。 前 来 
参加 实验 的 被 试 , 按 100 元 /小 时 支付 费 


4 数据 处 理 
4.1 问卷 数据 处 理 
实验 共计 收 到 671 份 问卷 ,剩余 有 效 问卷 544 份 。 
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主要 使 用 Excel 对 相关 性 标准 重要 性 分 值 进行 算数 平 
均 ( 不 考虑 个 人 权重 ) ,得 到 总 体 群 体 相关 性 标准 重要 


性 的 平均 分 数 。 
4.2 访谈 数据 处 理 


通过 Nvivo 进行 内 容 分 析 , 根 据 已 经 确定 的 相关 
性 标准 和 定义 对 访谈 内 容 进行 编码 ,由 课题 组 两 名 工 
作 人 员 进 行 交 叉 编 码 ,并 保证 一 致 率 在 85% 以 上 。 编 
马 结束 后 统计 各 个 相关 性 标准 在 访谈 中 出 现 的 先后 顺 
序 , 归 纳 相 关 性 判断 中 相关 性 标准 的 使 用 流程 ,并 统计 
相关 性 标准 出 现 的 频次 以 及 在 判断 过 程 中 所 起 的 作 
用 ,如 表 1 所 示 : 

表 1 


访谈 数据 相关 性 标准 使 用 统计 
(以 一 次 相关 性 判断 为 例 ) 
影响 程度 EH 负 向 


是 否 出 现 


4.3 层次 分 析 法 数据 处 理 

专家 打分 数据 分 析 主 要 分 为 3 个 步骤 : 

(1) 计 算 每 个 矩阵 各 个 相关 性 标准 的 权重 ,并 保 
证 结果 符合 一 致 性 检验 。 


(2) 对 专家 权重 进行 计算 ,根据 矩阵 的 特征 向 量 
确定 专家 的 内 容 权 重 ; 根 据 判断 矩阵 的 一 致 性 比例 确 


定 专家 的 逻辑 权重 ; 两 者 求 几何 平均 值得 到 专家 最 终 
的 权重 。 
根据 结构 模型 可 以 看 出 ,用 户 构 建 了 6 7312158 
阵 ( 相关 数 据 3 个 ,不 相关 数据 3 个 )。 因 此 分 别 得 到 
表 2、 表 3 所 示 的 专家 权重 
a bn in 
最 终 得 到 每 个 相关 性 标准 的 权重 , 见 表 4。 


n 


dar 使 用 次 序 (分 值 1-5) 影响 影响 PAE 5 结果 分 析 

Em 是 1 5 v 相关 "E 

OQ a 2, "ne 通过 对 两 个 阶段 实验 数据 的 分 析 比较 ,可 以 发 现 
D 是 3 1 V 不 相关 科学 数据 用 户 相关 性 标准 使 用 的 4 个 特征 。 


xr R2 层次 分 析 法 1 -10 号 用 户 权重 
O 相关 性 矩阵 类 型 1 号 2 号 3 号 4 号 5 号 6 号 7 号 8 号 9 号 10 号 
CY 相关 数据 获得 成 本 层 0.0772 0.0701 0.0605 0.0758 0.0395 0.1588 0.0999 0.1102 0.1586 0.1494 
CN 数据 优 劣 层 0.0766 0.0296 0.0725 0.1371 0.0042 0.1513 0.1501 0.1352 0.1325 0.0908 
S: 选择 数据 层 0.1220 0.1136 0.0909 0.0421 0.0536 0.1367 0.0696 0.1088 0.1263 0.1364 
2 不 相关 数据 获得 成 本 层 0.1721 0.1170 0.0086 0.1122 0.0432 0.1667 0.0392 0.0364 0.1373 0.0774 
数据 优 劣 层 0.0408 — 0.0497 0.1317 0.1317 0.1424 0.1454 0.1129 0.1492 0.0478 0.0484 
选择 数据 层 0.1432 0.1766 0.0394 0.0320 0.0463 0.1604 0.1078 0.1211 0.1195 0.0538 
© ER us 
c 表 3 层次 分 析 法 11 - 20 号 用 户 权重 
三 相关 性 矩阵 类 型 1 号 1 号 09 1 号 158 16 号 159 189 199 208 
(3 相关 数据 获得 成 本 层 0.0835 0.0841 0.1204 0.0807 0.0800 0.0802 0.1230 0.1136 0.1233 0.1114 
数据 优 劣 层 0.1538 0.0769 0.1538 0.0769 0.1538 0.0769 0.1538 0.0769 0.0385 0.0385 
选择 数据 层 0.0897 0.1575 0.0459 0.1577 0.1050 0.1237 0.1083 0.1089 0.0487 0.0547 
不 相关 数据 获得 成 本 层 0.0771 0.1212 0.0797 0.1212 0.1180 0.1046 0.1199 0.0727 0.0785 0.1070 
数据 优 劣 层 0.0204 0.1149 0.1533 0.1533 0.1118 0.0190 0.0069 0.1493 0.1093 0.0719 
选择 数据 层 0.0352 0.1807 0.1524 0.0617 0.1297 0.1095 0.1018 0.0984 0.0990 0.0315 
表 4 不 同情 境 下 相关 性 标准 权重 5.1 相关 性 标准 的 使 用 频次 呈现 长 尾 态 势 且 满足 最 
— 相关 数据 不 相关 数据 少 省 力 原则 
| 数据 一 般 型 数据 密集 型 数据 一 般 型 数据 密集 型 通过 对 用 户 的 访谈 内 容 进行 分 析 ,计算 各 个 相关 
时 效 性 0.143 5 0.1259 0.139 2 0.1163 EM 
e 性 标准 出 现 的 频次 ,并 绘制 了 百分比 分 布 图 ,如 图 3 所 
可 获得 性 0.042 2 0.038 3 0.004 7 0.038 7 E » 5 e 
可 用 性 0.064 2 0.046 2 0.060 8 0.052 4 示 。 由 分 布 图 可 以 看 出 ,使 用 最 为 频繁 的 标准 为 主题 
便利 性 0.026 1 0.018 5 0.00326 ^ 0.0191 TE(36. 896) ,其 次 为 质量 (23% ) ,排名 第 三 位 的 为 可 
主题 性 0.264 5 0.345 1 0.315 8 0.349 0 获得 性 (11% )， 主题 性 .质量 和 可 获得 性 的 使 用 频率 
质量 0.124 6 0.1127 0.123 9 0.098 3 
an 占据 2/3 ,这 3 个 标准 被 频繁 使 用 。 而 剩 下 6 个 相关 性 
规范 性 0.040 4 0.057 8 0.053 2 0.049 3 
全 面 性 0.078 7 0.067 0 0.062 4 0.074 3 标准 每 个 标准 的 占 比 不 超过 10% ,其 至 可 用 性 、 权 威 
权威 性 0.193 8 0.188 5 0.175 5 0.202 6 性 和 规范 性 的 占 比 均 低 于 5% ,可 见 这 几 个 标准 偶尔 
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被 使 用 。 但 是 6 个 相关 性 标准 出 现 频率 的 总 和 却 达 到 
了 30% ,占据 了 将 近 1/3 的 比例 。 整 体 呈 现 出 长 尾 分 

结合 调查 问卷 和 情境 实验 ,对 比分 析 了 相关 性 判 
断 中 ,相关 性 标准 的 使 用 频次 和 重要 性 分 数 ,结果 显示 
两 者 并 非 正 相 关 , 频 次 分 布 图 与 重要 性 分 布 图 趋势 差 
异 较 大 ,如 图 3 所 示 。 权 威 性 在 重要 性 打分 中 分 值 为 


好 、 认 知情 况 、 任 务 情况 而 有 所 区 别 。 主 题 性 确定 之 
后 ,主题 性 相关 , 则 进一步 使 用 质量 .可 获得 性 等 标准 
判断 ; 若 主题 性 不 相关 , 则 直接 放弃 ,开始 下 一 轮 检 索 
判断 。 这 是 主题 性 的 使 用 频次 远 高 于 其 他 标准 的 原 
因 。 因 为 主题 性 不 仅 用 来 判断 相关 数据 ,更 用 来 否定 
不 相关 数据 。 

表 5 相关 性 标准 出 现 次 序 频次 统计 (单位 :次 ) 


4.06 , 排 在 第 三 位 , 仅 次 于 质量 和 主题 性 ,但 是 在 实际 相关 性 标准 。 出 现 总 频次 “出 现 次 序 为 1 出 现 次 序 为 2 出 现 次 序 为 3 
情境 检索 过 程 中 ,使 用 频次 仅 为 7 次 , 排 在 倒数 第 二 主题 性 106 106 o 0 
位 。 可 获得 性 在 重要 性 打分 中 ,分 值 为 3. 71 , 排 在 倒 Bn is i ^ : 
数 第 二 位 ,但 是 在 实际 情境 检索 过 程 中 ,使 用 频次 为 | TUI : : 
33 次 , 排 在 第 三 位 。 同 样 规 范 性 、 便 利 性 等 也 存在 同 » . : : 
样 的 现象 。 结 合 访谈 内 容 得 出 ,用 户 在 实际 检索 过 程 A i i i i 
"pes d 8B RA ERE TR RUE 7) E A ZEAR (0 £9. 可 用 性 T 0 2 7 
如 归 最 优 的 数据 (高 质量 高 权威 性 ) 需 要 投入 成 本 过 权威 性 o 3 2 
态 Y 则 会 降低 要 求 ,选择 替代 数据 。 规范 性 ? 2 ] 
e ps 因此 这 符合 判断 决策 中 的 错 定 与 调整 策略 ,用 户 
e Han 在 判断 开始 阶段 将 注意 力 集中 在 主题 相关 这 个 错 上 ， 
q ha 在 后 续 的 判断 中 ,根据 其 他 的 标准 对 这 个 错 进行 不 充 
e [as cem 分 调整 。 若 锚 不 成 立 , 则 需要 重新 进行 销 定 或 直接 结 
e v OCUTETO | 束 判 断 得 出 “不 相关 ”的 结果 ,如 图 4 ER s 
CN, 35. 
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SE 主题 性 在 相关 性 判断 过 程 中 具有 锚 定 功能 
CD 在 相关 性 判断 中 ,最 常用 的 相关 性 标准 为 主题 性 、 
质量 和 可 获得 性 。 这 些 标准 不 是 同时 出 现 的 ,而 是 有 
先后 顺序 的 。 在 一 般 情 况 下 ,用户 最 先是 根据 关键 词 、 
题目 和 摘要 等 线索 判断 科学 数据 的 主题 性 。 在 主题 性 
相关 的 前 提 下 ,再 根据 其 他 标准 进行 调整 。 
如 表 5 所 示 ,访谈 中 主题 性 出 现 总 频次 106 次 ,以 
第 一 次 序 的 形式 出 现 的 频次 为 106 次 。 说 明 在 一 次 判 
断 中 ,只 要 使 用 了 主题 性 标准 进行 判断 , 那 肯定 是 第 一 
位 使 用 的 标准 。 出 现 次 序 为 1 的 标准 还 有 可 获得 性 和 
便利 性 。 追 漳 访 谈 内 容 发 现 ,可 获得 性 出 现在 第 一 位 
的 判断 情况 是 检索 结果 均 有 获取 权限 。 便 利 性 出 现在 
第 一 位 的 判断 情况 是 检索 结果 需要 用 户 注册 才能 查 
看 ,用 户 直 接 放弃 。 由 此 可 见 在 数据 资源 充足 可 用 的 
前 提 下 ,用 户 进 行 数据 相关 性 判断 的 首要 使 用 标准 是 
主题 性 。 在 一 次 判断 中 ,用 户 一 般 使 用 3 -5 个 标准 进 
行 判断 ,从 第 二 个 使 用 的 标准 开始 ,就 会 依据 个 人 喜 


提取 信息 


锚 定 于 该 数据 EE T 调整 最 初 的 估计 


4 科学 数据 相关 性 判断 中 相关 性 
标准 锁定 与 调整 流程 


当 用 户 开展 一 项 数据 任务 时 ,根据 自己 的 检索 任 
务 ,会 首先 在 心中 有 个 预期 ,并 设 定好 检索 式 。 在 检索 
过 程 中 ,根据 检索 式 检索 出 来 的 结果 与 自己 内 心 的 预 
期 结果 进行 比 对 来 判断 相关 性 。 用 户 总 会 首先 关注 关 
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键 词 题目 、 摘 要 等 一 系列 与 主题 相关 判断 有 关 的 信 
息 。 帮 主题 相关 , 则 锁定 该 条 信息 ,并 根据 后 续 更 多 的 
信息 判断 质量 .可 获得 性 .权威 性 .可 用 性 等 ,并 在 主题 
相关 的 基础 上 ,对 判断 结果 进行 调整 。 若 主题 不 相关 ， 
则 需要 调整 最 初 的 估计 ,开始 新 一 轮 检索 。 
5.3 ”相关 性 标准 具有 双向 性 
在 相关 性 判断 中 ,相关 性 标准 的 作用 具有 双向 性 。 
早 在 2002 年 K. Maglaughlin 学 者 的 研究 中 就 提 到 相关 
性 标准 对 文献 相关 性 判断 不 仅 有 积极 影响 ,还 有 消极 
影响 ” 。 同 样 , 针 对 科学 数据 相关 性 判断 也 有 相同 的 
特征 。 科 学 数据 相关 性 标准 对 相关 性 判断 的 影响 可 以 
分 为 两 类 ,一 类 是 主题 性 ,时效 性 权威 性 ` 质量、 全 面 
性 和 规范 性 , 均 具 有 双向 性 。 如 时 效 性 ,用 户 说 “这 个 
臣 闫 布 时 间 刚好 是 我 想 要 的 ” ,就 起 到 了 积极 作用 ;用 


户 说 “这 个 时 间 太 老 了 ,已 经 不 能 用 了 ”, 就 起 到 了 消 


N 
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是 数据 不 能 下 载 ,无 法 进一步 判断 ”, 就 起 到 了 


学 葡 据 元 数据 方面 的 标准 ,第 二 关 为 衡量 科学 数据 共 


到 颖 据 一 般 型 用 户 和 数据 密集 型 用 户 在 判断 数据 相关 
以 及 数据 不 相关 时 各 个 相关 性 标准 的 权重 , 见 表 4。 
不 同类 型 用 户 在 相同 的 数据 判断 结果 中 具体 标准 
权重 分 配 上 存在 差异 ,如 数据 一 般 型 用 户 选择 相关 数 
据 时 ,主题 性 权重 为 0.264 5 ,权威 性 权重 为 0. 193 8; 
数据 密集 型 用 户 选 择 相关 数据 时 , 主题 性 权重 为 
0.345 1 ,权威 性 权重 为 0.188 5。 相 同类 型 用 户 在 不 


数据 的 权重 对 比 还 是 相同 用 户 类 型 选择 不 同 数据 的 权 
重 对 比 ,整体 上 相关 性 标准 发 挥 作用 的 整体 趋势 一 致 
且 通 过 配对 了 检验 ,发 现 显 著 性 系数 P 均 大 于 0.01 , 接 
受 原 假设 ( 见 表 6) , 即 相 关 性 标准 权重 整体 没有 显著 
差异 。 

表 6 ， 不同 对 组 间 相 关 性 标准 权重 配对 工 检 验 


般 型 用 户 。 ”密集 型 用 户 ”相关 一 般 型 - 不 相关 一 般 型 - 
相关 - 不 相关 ”相关 - 不 相关 密集 型 密集 型 
显著 性 0. 867 0.997 0. 888 0. 999 


对 组 


因此 可 以 看 出 相关 性 标准 权重 具体 数值 随 着 情境 
的 变化 会 有 差异 ,标准 的 使 用 顺序 也 会 有 所 不 同 ,但 是 
其 整体 使 用 权重 会 保持 相对 稳定 。 


6 讨论 


本 项 研究 立足 科学 数据 开展 研究 ,探究 了 在 科学 
数据 相关 性 判断 过 程 中 ,相关 性 标准 的 使 用 特征 。 研 
究 采用 了 决策 领域 的 层次 分 析 法 与 本 领域 研究 传统 的 
情境 实验 和 调查 问卷 相 结合 的 方式 开展 研究 。 情 境 实 
验 是 相关 性 研究 领域 中 最 为 经 典 的 实验 设计 (C. Wat- 
son ^ A Hamid 47" A K) ,结合 情境 开展 实验 既 
可 以 充分 将 用 户 需 求 与 情境 相 结合 ,更 加 真实 地 反映 
判断 过 程 ,又 可 以 即时 获取 想 要 的 数据 ,保证 数据 的 质 
量 。 这 种 方法 获取 的 数据 主要 依靠 内 容 分 析 进 行 定性 
分 析 ,学 者 们 主要 统计 了 相关 性 标准 出 现 的 频次 ,依据 
频次 来 阐述 其 重要 性 ,但 是 本 文通 过 数据 分 析 发 现 , 相 
关 性 标准 的 使 用 频次 与 重要 性 不 成 正比 。 因 此 此 种 方 
法 不 能 很 好 地 探究 其 对 相关 性 判断 的 影响 。 为 了 更 加 
客观 地 分 析 相 关 性 标准 的 影响 ,有 学 者 (Z. Chen 
G Y, Xu \ 韦 草原 等 ) 引 入 了 结构 方程 ,通过 
量 的 问卷 调查 数据 建立 结构 方程 模型 ,从 而 得 到 相 
关 性 标准 的 权重 ,解决 了 情境 实验 面临 的 困境 。 但 是 
相关 性 判断 既 与 情境 密切 相关 ,又 具有 个 性 化 差异 , 脱 
A T E BT [e] A VAL t s e AUR S CSI YE , d. 7G VB 
用 户 之 间 的 差异 。 考 虑 到 这 些 问题 ,本 研究 引入 了 决 


同 的 数据 判断 结果 中 具体 标准 权重 分 配 上 存在 差异 ， 
如 数据 一 般 型 用 户 在 判断 数据 相关 时 , 主题 性 权重 
0.264 5 ,权威 性 权重 0. 193 8 ;在 判断 数据 不 相关 时 ， 
主题 性 权重 0.315 8 ,权威 性 权重 0. 175 5。 由 此 可 见 ， 
判断 数据 相关 时 ,主要 判断 标准 (如 主题 性 质量 .权威 
性 和 时 效 性 ) 的 权重 分 配 较为 均匀 。 而 判断 数据 不 相 
关 时 ,主要 判断 标准 的 权重 分 配 差 距 明 显 拉 大 。 主 题 
性 权重 占据 了 41.696 ,也 体现 出 在 判断 不 相关 时 , 主 
题 性 的 作用 更 大 。 但 是 无 论 是 不 同 用 户 类 型 选择 相关 


策 领 域 的 层次 分 析 法 , 既 能 贴 合 任务 情境 和 用 户 的 个 
性 化 差异 ,又 能 进行 定量 计算 ,分 析 相 关 性 标准 的 权 
重 。 从 而 弥补 了 传统 方法 的 不 足 。 

用 户 在 判断 科学 数据 过 程 中 ,相关 性 标准 的 使 用 
情况 与 传统 信息 载体 基本 一 致 。 在 文献 ,图像 、 网 页 、 
视频 等 一 系列 的 研究 中 , 主题 性 和 质量 都 是 重要 的 标 
VE ” 。 但 是 也 存在 一 些 差异 ,比如 时 效 性 的 影响 就 
比较 低 ,因为 在 很 多 研究 者 眼中 ,数据 没有 过 时 ,重点 
在 于 自己 关注 的 时 间 范 围 ,有 时 候 甚至 年 代 越 久远 的 
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数据 对 于 研究 更 有 价值 。 这 一 点 与 文献 .新 闻 等 就 有 
很 大 差异 。 同 时 也 体现 了 数据 管理 与 存储 的 重要 性 。 

同时 相关 性 标准 使 用 符合 长 尾 定 律 。 当 前 数据 共 
享 如 火 如 茶 , 但 是 却 存在 诸多 壁垒 。 虽 然 用 户 常用 的 
相关 性 标准 只 有 3 个 ,但 是 剩 下 的 标准 却 占 据 了 30% 
的 份额 。 很 多 数据 共享 的 困境 正 是 由 这 些小 份额 的 相 
关 性 标准 造成 的 ,如 数据 不 规范 、 下 载 的 数据 不 全 、 数 
据 格式 不 统一 等 。 如 果 数 据 共享 与 服务 的 研究 中 可 以 
充分 考虑 这 些小 占 比 的 相关 性 标准 ,破除 壁垒 ,将 极 大 
提升 数据 共享 与 服务 质量 。 

锚 定 调整 策略 广泛 应 用 于 判断 决策 领域 ,如 司法 
判断 .财务 问题 等 。 相 关 性 判断 是 信息 科学 领域 的 基 
本 过 程 ,与 情境 有 着 密切 联系 ,同样 满足 锚 定 调整 策 


用 户 反馈 在 国内 数据 共享 平台 检索 时 ,很 多 数据 都 不 
够 全 面 ,一 些 数 据 只 有 简介 ,具体 数据 都 是 空白 的 ,为 
他 们 后 续 的 数据 使 用 造成 了 很 多 麻烦 。 因 此 需要 提高 
我 国 科 技 人 员 数 据 共享 的 意识 ,也 不 断 加 强 与 完善 数 
据 共享 基础 设施 ,补充 完善 缺失 数据 ,切实 为 用 户 提 供 
数据 支撑 。 

(2) 完 善 平台 的 “导航 式 " 检索 模 式 。 用 户 在 检索 
数据 中 以 主题 判断 为 主 ,访谈 过 程 中 也 发 现 用 户 更 愿 
意 使 用 导航 检索 。 导 航 式 检索 可 以 帮助 用 户 更 快 地 定 
位 到 相关 的 领域 和 主题 。 因 此 要 针对 各 大 平台 的 数据 


- 


特点 和 用 户 人 群 ,对 数据 进行 精确 分 类 ,从 而 辅助 用 户 


(3) 改 进 科学 数据 共享 平台 中 元 数据 的 页 面 布 


略 一 主题 性 为 钳 , 也 是 相关 性 判断 中 最 重要 的 标准 ,最 
终 的 判断 结果 是 根据 情境 需要 不 断 在 主题 性 这 个 锚 定 
出 上 不 断 调整 得 出 的 。 
CN 通过 层次 分 析 法 分 别 计算 了 标准 在 判断 数据 相关 
搜 据 不 相关 时 的 权重 。Y. Xu 用 结构 方程 计算 了 
5 命 文 献 相关 性 标准 (主题 性 、 可 信和 度 、 可 理解 性 新颖 
性 S 阁 域 ) 的 权重 ,但 是 没有 对 判断 结果 进行 分 类 计算 。 
其 昌 主 题 性 为 0.31 ,与 本 文 主题 性 的 权重 相近 。S.Y. 


局 。 科 学 数据 包含 很 多 元 数据 ,不 同 元 数据 在 用 户 判 
断 过 程 中 起 的 作用 不 同 , 与 主题 相关 的 题目 、 摘 要 、 关 
键 词 ,与 质量 相关 的 数据 采集 过 程 、 采 集 标准 、 认 证 级 
别 ,与 权威 性 相关 性 的 发 布 单位 .发布 者 等 元 数据 更 为 
重要 ,应 放 在 醒目 的 位 置 ,方便 用 户 判 断 。 

(4) 改进 系统 的 人 机 交互 性 。 根 据 IP 或 者 用 户 名 
记录 每 位 用 户 的 检索 记录 ,根据 浏览 和 点 击 记录 不 断 
明确 用 户 的 检索 策略 ,根据 不 同 的 检索 策略 为 不 同 的 


Rich) ”通过 定性 研究 得 出 除了 主题 性 ,质量 和 权威 性 
古训 为 重要 标准 的 结论 。 可 以 看 出 ,通过 层次 分 析 法 
计 竹 得 出 的 权重 基本 与 其 他 学 者 研究 中 相关 性 标准 的 
械 对 分布 大 致 一 致 。 因 此 可 以 看 出 相关 性 标准 的 使 用 
权 宣 相对 保持 稳定 ,也 进一步 证 实 了 将 层次 分 析 法 引 
人 各 相关 性 判断 领域 研究 的 可 行 性 和 可 操作 性 。 


7 ~ 结论 


本 文 在 前 人 研究 提出 的 9 个 科学 数据 相关 性 标 
准 的 基础 上 开展 研究 ,通过 调查 问卷 深度 访谈 和 层 
次 分 析 相 结合 的 方法 探究 了 科学 数据 相关 性 标准 的 
使 用 特征 。 研 究 表 明 , 科 学 数据 相关 性 标准 使 用 主 
要 呈现 以 下 4 个 特征 :中 相关 性 标准 的 使 用 情况 符合 
著名 的 长 尾 定律 且 满 足 最 少 省 力 原则 ;名 主题 性 在 
相关 性 判断 过 程 中 具有 锚 定 功能 ;@ 相 关 性 标准 在 
相关 性 判断 中 具有 双向 性 ;相关 性 标准 使 用 权重 
相对 稳定 。 
通过 对 科学 数据 相关 性 标准 使 用 特征 的 探索 , 准 
确 把 握 了 科学 数据 用 户 的 检索 策略 ,明晰 了 其 检索 行 
为 ,从 而 为 改进 科学 数据 共享 系统 提供 可 操作 性 的 建 
议 如 下 : 

(1) 补 充 完善 科学 数据 共享 平台 中 的 缺失 信息 。 


用 户 提 供 不 同 的 信息 呈现 顺序 和 方式 ,从 而 满足 个 性 
化 需求 。 
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Usage Characteristics of Scientific Data Relevance Criteria 
Zhang Guilan' Zhou Guomin? Pan Yao! Liu Jianping? Wang Jian’? 
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* Agricultural Information Institute of CAAS, Beijing 100081 
Abstract: | Purpose/significance | This paper explored the use characteristics of relevance criteria that affect 
the users’ relevance judgment when they retrieved data, so as to further explore the information behavior of scientific 
users and provide theoretical support for improving the data retrieval platform. | Method/process | The research was 
carried out by combining questionnaire, interview and AHP. The subjects were graduate students in universities and 
"Wesearch institutes. | Result/conclusion | The analysis results showed that the relevance criteria presented 4 charac- 
ieristies : the use of relevance criteria conformed to the famous long tail law; topicality had anchoring function in the 
和 of relevance judgment; relevance criteria were bidirectional; the weights of relevance criteria were relative 
bility. The research accurately grasped the retrieval strategy of scientific data users and clarified their retrieval be- 


Chavior, thus providing operable suggestions for improving the scientific data sharing system. 
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